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面向 少 样本 网 状 结构 体 的 候选 区 域 自 适应 检测 方法 


(武汉 科技 大 学 a. 计算 机 科学 与 技术 学 院 ;b. 智能 信息 处 理 与 实时 工业 系统 湖北 省 重点 实验 室 , 武汉 430065) 


摘 要 : 在 仅 有 少 签 数 据 的 图 像 网 状 结构 检测 任务 中 ， 需 要 大 量 训练 数据 的 目标 检测 模型 检测 性 能 大 幅 下 降 。 基 

于 区 域 候选 的 目标 检测 模型 在 预测 时 ， 检 测 目 标 越 多 ， 检 测 时 间 越 长 。 若 基于 区 域 候 选 的 目标 检测 模型 产生 候选 框 的 

数量 固定 不 变 ， 而 不 同 图 像 中 网 状 结构 目标 数量 不 同 ， 造 成 目标 检测 中 额外 的 时 间 消 耗 。 针 对 该 问题 ， 通 过 对 训练 样 

本 中 网 状 结构 目标 在 图 片 中 的 密度 分 析 以 及 根据 网 状 结构 体 在 图 片 中 的 特征 分 布 ， 提 出 一 种 面向 少 样本 网 状 结构 体 的 
选区 域 自 适应 检测 方法 。 该 方法 通过 基于 二 值 标签 图 标注 方法 得 到 大 量 训练 样本 ， 由 候选 区 域 自 适 应 方法 选取 合理 

候选 框 数 量 。 与 未 改进 的 模型 相 比 ， 在 几乎 不 损失 准确 率 的 情况 下 ， 加 快 了 检测 速度 ， 万 其 在 目标 数量 稀少 的 数据 中 

优势 更 为 明显 。 
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Abstract: The detection performance of the object detection model requiring a large amount of training data is greatly reduced 


in the reticular structures detection task with a small amount of labeled data. The detection model which based on region 


proposals will spend longer time with larger outputs during predicting. And the number of reticular structures are different in 
different images. It will result in extra time consumption in object detection if the number of proposals is fixed in different 
images. In view of this problem, we propose an proposal adaptive detection method for small sample reticular structures by 
analyzing the density of the reticular structures in the training samples and according to the characteristic distribution of the 
大 = reticular structures in the images. In this method, a large number of training samples are obtained by the method of 
binary-value labeled map marking, and a reasonable number of proposals are selected by the proposal adaptive method . 
Compared with the unimproved model, the detection Speed is accelerated without loss of accuracy, especially in the data with 
few objects. 
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0 引言 检测 模型 建立 在 区 域 候选 的 思想 上 ， 首 先 对 检测 区 域 提取 候选 
框 ， 然 后 再 将 提取 的 候选 框 用 于 后 续 特 征 提 取 、 候 选 框 回归 和 

深度 学 习 在 视觉 识别 任务 中 取得 了 巨大 成 功 023， 然 而 ， 分 类 加 。 在 基于 区 域 候 选 的 模型 中 ， 比 较 典 型 的 方法 包括 

这 些 模型 需要 大 量 标签 数据 和 人 友 代 次 数 来 训练 大 量 参数 。 实 际 。 R-CNNI1、Fast R-CNNIS]、Faster R-CNNDI 等 一 系列 方法 。 基 于 
中 会 面临 少量 甚至 没有 标签 数据 的 情况 ， 且 人 工 标注 标签 数据 可 归 的 模型 采用 回归 的 思想 ， 需 要 预先 按照 一 定 方式 划 定 默认 
工作 繁重 ， 代 价 太 大 。 有 目前， 针对 标签 数据 少 的 问题 ， 涌 现 了 框 ， 从 而 建立 起 预测 框 、 默 认 框 、ground-truth 物体 框 的 关系 
许多 诸如 数据 增强 、 少 样本 学 习 外 等 技术 。 以 进行 训练 2020， 如 YOLOU0，SDDI0 等 一 些 列 优秀 模型 。 对 
目前 ， 深 度 学 习 om 法 主要 分 为 两 类 : 基于 区 域 修 。 于 第 一 类 方法 ， 目 标 检 测 性 能 表现 优秀 ， 但 相对 第 二 类 方法 其 

选 的 模型 和 基于 回归 的 模型 外 。 基 于 区 域 候选 的 深度 学 习 目 标 ” 检测 速度 很 慢 ; 相对 于 第 一 类 方法 , 第 二 类 方法 检测 性 能 下 降 ， 
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其 检测 速度 提升 明 
区 域 候选 的 模型 通过 区 域 候选 网 络 产 生 候 选 框 ， 再 将 
候选 框 输入 到 全 连 


基于 


显 02。 


接 层 进 行 多 分 类 和 下 


归 计 算 。 


由 于 全 连 : 


Ea 


五 
本 


御 


1.3 基于 区 域 候 选 的 模型 


前 , 目标 检测 模型 主要 包含 


面向 少 样本 网 状 结构 体 的 候选 区 域 自 适 户 


基于 所 


归 的 模型 。 基 


参数 众多 ， 在 预测 时 每 一 个 神经 元 都 参与 运算 ， 


输入 增多 ， 则 预测 时 间 成 倍增 加 023。 不 同 网 状 结构 体 样 本 ， 


不 变 的 输出 作为 全 连接 层 的 输入 ， 使 得 参与 全 连接 
选 框 多 于 待 检测 
相互 连接 以 及 量 树 形 拓扑 分 布 的 网 状 


检测 目标 数量 不 同 ; 


对 于 不 同 数据 ， 在 区 域 候选 阶段 ， 以 


若 全 连接 


人 工 标注 不 精确 等 问题 。 


层 计算 的 候 


目标 ， 造 成 额外 时 间 耗 费 。 同 时 在 纵横 交错 、 
结构 体 标注 过 程 中 ， 候 选 
框 标签 需 连 续 分 布 以 覆盖 整个 网 状 结构 体 ， 导 致 人 工 标注 工作 
繁重 ， 耗 时 耗 力 ， 旧 


(two-st 


(one-stage) 深 度 节 
测 神经 网 络 的 精度 更 高 。 
取得 了 长 


使 得 目 


经 网 
经 网 


age) 深 度 字 


于 区 域 候选 的 模型 


络 ， 而 基 


于 回归 的 模型 


络 。 相 较 


区 域 候选 的 模型 ; 
是 一 种 两 次 检测 
是 一 种 单 次 检测 


于 单 次 检测 神经 网 络 ， 两 次 检 


早 


标 检测 


步 提 高 了 基于 
选 网 络 从 Selective Search171 到 
度 ， 在 区 域 候选 网 络 之 后 加 入 全 连接 层 对 候选 


区 


高 了 模型 预测 精度 。 


或 候选 模型 


期 方法 丸 


1 R-CNNI、 Fast R-CNN!S] 
远 的 进步 ，Faster R-CNNB 的 出 现 进 一 
的 检测 速度 和 检测 精度 。 对 区 域 候 
RPNDI 的 改进 加 快 了 模型 预测 速 


区 域 分 类 回归 提 


针对 以 上 两 方面 问题 ， 本 文 提出 一 种 面向 少 样本 网 状 结构 “1.4 网 状 结构 体 
体 的 候选 区 域 自 适应 检测 方法 ， 该 方法 通过 两 级 预 处 理 将 网 状 现实 生活 中 ， 网 状 结构 体 无 处 不 在 。 对 人 体 静 脉 血 管 ， 视 
结构 体 划 分 成 线 状 集合 ， 再 将 线 状 集合 划分 为 块 状 集合 ， 最 后 。 网 膜 眼底 血管 等 网 状 结构 体 的 检测 与 分 割 有 助 于 及 时 发 现 病 
获得 大 量 精确 标注 的 候选 框 ， 达 到 数据 扩 增 的 效果 。 同 时 , 该 ” 患 ， 降 低 人 体 健 康 危 害 ， 对 卫星 道路 ， 地 面 裂 缝 等 网 状 结构 体 
方法 根据 不 同 训 练 数据 中 目标 密度 ， 设 计 一 种 候选 区 域 自 适 应 ”的 检测 有 助 于 降低 人 工 检测 的 安全 风险 214。 目 前 ， 针 对 网 状 结 
算法 ， 选 取 合适 候选 框 数量 作为 区 域 候选 网 络 的 输出 ， 从 而 减 。 构 体 的 分 割 方法 主要 基于 U-Netti3 展 开 研究 ， 而 针对 网 状 结构 
少 全 连接 层 的 计算 耗 时 ,达到 在 几乎 不 降低 模型 性 能 的 前 提 下 ， ” 体 的 检测 方法 相对 较 少 ， 由 于 网 状 结构 体 结构 复杂 ， 对 模型 检 
加 快 预测 速度 的 效果 。 实 验 结果 表明 ， 该 方法 对 面向 小 样本 网 。“ 测 精 度 要 求 高 ， 因 此 对 网 状 结构 体 的 检测 主要 基于 区 域 候选 模 
状 结构 体检 测 有 着 良好 的 性 能 表现 ， 对 不 同 数据 的 检测 时 间 有 ”型 展开 研究 。 
人 2 。 面向 少 样本 网 状 结构 体 的 候选 区 域 自 适应 检测 
1 ”国内 外 研究 现状 2.1 面向 少 样本 网 状 结构 体检 测 
1.1 数据 增 广 在 网 状 结构 体 二 维 图 像 中 ， 有 许多 交错 并 相互 连接 的 线 状 
深度 学 习 模 型 的 训练 需要 大 量 标签 数据 ， 现 实 中 ， 当 只 集合 。 例 如 图 1(a) 所 示 视 网 膜 血 管 中 以 视盘 为 中 心 呈 树 根 状 分 
少量 标签 数据 时 ， 训 练 的 深度 学 习 模 型 性 能 大 幅 下 降 。 数 据 增 ， 布 的 网 状 结构 体 ， 图 1b) 所 示 的 道路 图 像 中 呈 狭 长 面条 状 的 网 
广 技术 为 面临 少量 标签 数据 训练 模型 的 情况 提供 了 一 种 解决 方 ” 状 结构 体 。 
案 。 数据 增 广 技术 指 在 不 改变 图 像 类 别 的 情况 下 , 增加 数据 量 ， 网 状 结构 体 图 像 的 网 状 结构 纵横 交错 、 相 互 连 接 且 分 布 广 
提高 模型 的 泛 化 能 力 。 从 几何 角度 看 ， 常 用 的 数据 增 广 技术 包 ， 泛 。 康 定 斯 基 理 论 09 认 为 ， 点 、 线 、 面 构成 平面 空间 的 基本 元 
括 翻转 ， 位 移 ， 裁 前 等 ， 从 图 像 像素 变换 角度 看 ， 常 用 方法 包 ，” 素 。 受 此 理论 启发 ， 将 网 状 结构 体 看 作 二 维 图 像 中 的 “ 面 ” 进 
括 颜 色 抖 动 ， 增 加 噪声 等 。 一 步 将 网 状 结构 体 进行 第 一 层 划分 ， 使 之 成 为 线 状 结构 体 ， 将 
1.2 少 样 本 学 习 线 状 体 看 作 “ 线 ” 再 对 线 状 体 进 行 第 二 层 划 分 ,使 之 成 为 块 状 
近年 来 ， 针 对 标签 数据 量 少 的 情况 ， 国 内 外 进行 了 大 量 的 体 ， 将 块 状 体 看 作 “ 点 ”。 通 过 对 网 状 结构 体 的 分 层 处 理 思 想 ， 
研究 。 早 期 方法 将 在 源 域 (source domain) 数 据 中 学 习 的 经 验 知 。” 采用 基于 二 值 标 签 图 标注 方法 对 样本 进行 标注 ， 最 终 获 得 用 于 
识 用 于 目标 域 (target domain) 训 练 和 学 习 的 迁移 学 习 技 术 ， 训练 的 候选 框 。 整 个 分 层 处 理 过 程 如 图 2 所 示 。 图 2 中 ， 在 左 
(transfer learning)03 为 少 样本 学 习 开 拓 了 新 道路 .迁移 学 习 技 术 侧 虚 线 区 域内 黄色 边框 代表 第 一 层 分 解 得 到 线 状 体 结合 ， 绿 色 边框 代表 第 
对 深度 学 习 模 型 性 能 提升 明显 ， 但 模型 性 能 的 提升 仍然 具有 很 。 ”二 层 分 解 得 到 块 状 集合 ， 得 到 块 状 体 后 ， 根 据 步骤 四 计算 IoU， 生 成 候选 
大 空间 。 目 前 深度 学 习 方 法 在 训练 过 程 中 ， 利 用 神经 网 络 提取 框 ， 最 后 根据 二 值 标签 图 生成 的 候选 框 坐 标 ， 在 训练 样本 中 进行 标注 。 


目标 特征 , 然后 对 特征 进行 分 类 以 及 回归 , 然而 在 这 一 过 程 中 ， 


大 多 数 方法 将 焦点 放 在 样本 独立 性 上 ， 没 有 考虑 


以 及 


neural network) 上 


14]， 


标 之 间 的 相似 关系 ， 基 于 此 ， 出 现 了 挛 4 


匹配 网 络 (matching network) 


同类 样本 之 间 
FE 网络 (siamese 
15， 原 型 网 络 


(prototypical networks)09, 关系 网 络 (relation network) 47 等 一 系 


列 新 颖 网 络 , 这些 网 络 将 焦点 集中 于 学 习 样 本 之 间 的 相似 关系 ， 
使 得 模型 拥有 比较 样本 之 间 相 似 度 的 能 力 ， 从 而 利用 
样本 ， 通 过 相似 度 比 较 ， 实 现 分 类 和 识别 的 目的 。 
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pe 


坐标 进行 归 


于 二 值 标签 图 标注 方法 流程 图 
车 于 二 值 标签 图 标注 方法 步骤 如 下 : 


a) 根 据 二 值 化 标签 图 (图 3(a))， 对 前 景区 域 进行 骨架 提取 ， 
然后 以 骨架 坐标 作为 候选 框 的 中 心 坐标 ， 选 取 第 一 个 候选 框 ; 


b) 以 当前 候选 框 边 长 二 


- 的 距离 ， 在 骨架 坐标 上 重新 找 点 ， 


作为 下 一 个 候选 框 的 中 心 坐标 ; 
9 以 当前 候选 框 边 长 w,h 以 及 第 b) 步 生成 的 候选 中 心 生成 
新 的 候选 框 ; 
d) 计 算 被 新 候选 框 覆盖 的 标签 
的 候选 框 面积 的 比值 (如 图 3(b))， 即 


面积 与 新 生成 


ground_turth 


Jo U 到 S round truth 
S, 


new_ proposal 
e) 当 1oU elloU,,, 
b)~e) 继 续 生 成 候选 机 
f) 若 IoU < ToU,,, 


;了 时， 则 完成 新 候选 框 的 生成 ， 然 后 执行 


[El 


， 则 新 候选 框 中 心 坐标 不 变 ， 以 当前 候选 
框 边 长 m 倍 为 新 候选 框 边 长 ， 重 新 生成 候选 框 ， 重 复 步 又 d)e) 
直至 满足 JoV el10U%,1] ; 


g) 车 JoU >1， 则 以 二 替换 步骤 人 中 司 ， 继续 步 又 了 


hb) 重 复 步 又 b)~g) 直 至 结 


采用 基于 二 值 标签 图 标注 方法 ， 第 一 层 分 解 将 网 状 结构 体 

分 成 含有 线 状 集合 的 N 个 部 分 , 第 二 层 分 解 将 线 状 集合 划分 成 

含有 块 状 体 集合 的 m 个 块 ， 最 后 对 块 状 体 进行 标注 ; 若 网 状 结 
构 体 样本 总 数 为 ww ， 则 分 级 算法 生成 的 候选 框 数 量 为 

Nv = NoxN xN, (1) 

另外 ， 在 算法 标注 过 程 中 ， 生 成 新 候选 框 的 中 心 坐标 与 当前 后 
输入 层 卷 积 层 


图 4 全 连接 层 示意 图 。 绿 
式 (4) 与 文献 [15] 中 不 同 之 处 在 于 ， 公 式 (4) 未 对 错 点 (anchors) 
化 ， 其 中 i 表示 锚 点 的 编号 ，p， 表示 第 i 个 


色 表示 全 连接 层 的 输入 , 4, 加,……， 
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候选 框 边 长 有 关 ， 即 


(Xn ， yin) 性 ， yin) 


VO Om = (min(wh 中 四 


其 中 : G64,yin) 表示 新 候选 框 的 中 心 点 坐标 ，(# 7) 表示 骨架 线 
上 的 坐标 点 ， 人 ,yw) 表示 当前 候选 框 中 心 坐 标 ，w,h 表示 
前 候选 框 长 和 宽 。 设 当前 候选 框 为 B(x,y,w, 有 ) ， 则 根据 基于 二 
值 标签 图 标注 方法 可 求 得 每 一 次 迭代 中 ， 新 候选 框 为 
Pu=C (P)+A: Lv Wn hin) (3) 
式 (3) 表 示 新 生成 候选 框 的 中 心 点 坐标 需要 根据 当前 候选 
框 决定 ， 同 时 新 候选 框 的 大 小 和 新 的 ov 有 关 ， 其 中 Cu(B) 表 
示 以 当前 候选 框 生成 新 候选 框 的 中 心 坐标 ，5v(*) 表示 根据 


ToU 值 计算 新 候选 框 的 边 长 ， 基 于 二 值 标签 图 标注 方法 最 终 效 
果 如 图 3(c) 所 示 。 


VR 


) I\rle 
,ll 


(a) 基于 二 值 标签 图 标注 方法 在 标注 时 所 需 的 二 值 化 标签 图 (b) 基于 
二 值 标签 图 标注 方法 中 标注 候选 框 时 IoU 示意 图 ,红色 阴影 为 IoU, 定 义 
为 ground_turth 面积 与 候选 框 面 积 的 比值 (c) 通过 基于 二 值 标签 图 标 
行 标注 的 结果 图 ,其 中 绿色 边框 表示 标注 的 候选 框 ,候选 框 标 
注 精 确 且 连 续 分 布 

图 3 二 值 标签 图 标注 方法 

根据 式 (1)， 当 网 状 结构 体 样 本 较 少 时 ， 可 通过 基于 二 值 标 
签 图 标注 方法 ， 标 注 大 量 候选 框 ， 扩 充 训练 样本 ， 为 网 状 结构 
体 训练 样本 量 少 提供 了 解决 方案 。 
2.2 ”候选 区 域 自 适 应 

在 生成 候选 框 阶 段 ， 在 一 张 图 像 中 随机 生成 Nx VN。 
(anchors)， 然 后 对 每 一 个 锚 点 进行 分 类 和 回归 ， 最 终 输 出 前 N 
个 候选 框 (proposals)。 在 Faster R-CNN05 中 ， 其 损失 函数 可 简 
化 为 


注 方法 j 


个 锚 点 


We 
山 


L(pi,t)=L,(pi, Pp;) + Ap; Lo (t,t) (4) 


全 连接 层 


输出 层 


90 


90900004 


[cx 


全 连接 层 输 入 个 数 
n， 输 出 个 数 m 


大, 表示 全 连接 层 神经 元 , %m…… 加 表示 全 连接 层 输出 结果 
销 点 预测 为 目标 的 概率 ， p; 表示 第 i 个 ground-truth 标签 值 ， 
当 第 ; 个 锚 点 判定 为 正 样 本 时 ，p;=1 ， 当 第 i 个 锚 点 判定 为 
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负 样 本 时 ，p;i=0 , # 与 翅 


与 第 ;个 错 点 的 坐标 相关 。 从 公式 (4) 


可 以 看 出 ， 在 最 优化 过 程 
点 进行 分 类 与 区 
的 输出 。 


Ye, 


经 过 候选 生成 阶段 产生 的 候选 框 特征 , 继续 输入 全 连接 层 
(fully connected layers, FC) 进 行 分 类 和 回归 ， 在 该 阶段 中 ,全 连 


接 层 在 神经 网 络 中 起 到 分 


all 


区 域 候选 网 络 产 生 N 个 


中 ， 需 要 对 每 张 图 片 中 生成 的 每 个 错 
优化 ,最 终 优化 出 前 N 个 候选 框 作为 该 阶段 


Pu=max{ 


来 计算 目标 数量 。 
在 模型 预测 时 , 根据 测试 图 片 


类 器 的 作用 ， 将 学 到 的 分 布 式 特征 表 


映射 到 样本 标记 空间 叶 。 如 图 4 所 示 为 一 个 全 连 


己 


2 
示意 医 


xn 大 小 的 候选 框 , 则 全 连 


小 为 nxnxN ， 且 全 连接 层 的 输出 大 小 为 k。 因 此 全 连接 层 的 计 


算 大 小 为 nxnxNxk ， 其 计算 公式 为 


其 中 : w 为 权重 和 矩阵，b 


为 偏 置 。 因 此 在 全 连接 层 需 要 对 每 一 
个 神经 元 进行 计算 ， 才 能 得 到 最 终 的 结果 。 若 计算 一 个 神经 元 


的 时 间 消 耗 为 :， 则 计算 全 部 神经 元 的 时 间 消 耗 为 


其 时 间 消 耗 与 候选 区 域 


T(N)=7x7xNxkt 


呈 线 性 关系 。 


(6) 


通过 式 (6) 及 以 上 分 析 可 得 , 在 候选 框 生成 阶段 , 产生 的 候 


选区 域 N 越 小 ， 模型 预测 时 间 越 短 。 因 此 可 通过 减少 候选 区 域 


N 达到 加 快 模型 预测 速度 的 目的 。 但 通过 多 次 试验 发 现 , 当 NN 


减 小 到 一 定 值 后 ， 目 标 检 


测 模型 出 现 大 量 漏 检 现 象 。 如 图 5 所 


示 。 其 中 (a)~(c) 分 别 表示 候选 框 设 定 
状 结构 体 中 的 目标 个 数 ，(a) 出 现 大 量 漏 检 现象 ，(b) 和 (c) 表 现 


N=300 时 ， 检 测 出 的 目标 个 数 都 为 98。 
为 解决 生成 候 区 域 阶段 对 不 同 数据 因 输 出 候选 框 个 数 N 


设置 过 小 出 


过 大 造成 额外 预测 时 间 消 
现 大 量 漏 检 的 问题 ， 本 文 


为 50、100、300 时 ， 最 终 检测 出 网 


8 在 N=100 和 


耗 ， 以 及 因 候选 区 域 数 上 


的 数据 ， 自 适应 选取 合理 


吴 选区 域 数 量 。 


时 出 候选 区 域 自 适 应 算法 ， 针 对 不 同 


(WN=50, 检 测 结果 =50 (b)N=100, 检 测 结果 =98 (ON=300, 检 测 结果 =98 
片 在 不 同 N 值 下 的 预测 情况 


图 5 同一 张 图 


在 2.1 市 中 ,每 一 张 图 


片 经 由 基于 二 值 标签 图 标注 方法 生成 


许多 候选 框 ,每 一 张 图 片 
量 与 图 片面 积 的 比值 , 即 


即 图 片 中 单位 面积 内 


FP 块 密 度 定义 为 图 片 中 标注 候选 框 数 


(7) 


候选 框 的 个 数 。 很 显然， 


度 越 大 ， 代 表 着 图 像 中 的 


多 


像 的 块 密 


标 越 多 ， 所 以 可 以 根据 块 密度 p; 来 


计算 目标 数量 。 由 于 训练 
且 区 域 候选 网 络 接 受 任 


样本 中 不 同 图 片 有 着 不 同 的 块 密度 ， 


意 大 小 图 片 ， 同 时 又 要 保证 


检测 出 所 有 目标 ， 故 采用 


模型 能 够 


训练 样本 中 块 密度 最 大 值 cu ， 即 


lie0,N] (8) 


的 长 (五 )、 宽 (W ), 利用 式 (7) 


计算 出 当前 测试 图 片 在 候选 生成 阶段 的 N 值 ， 即 


以 此 计算 出 最 终 的 候选 区 域 ， 
能 ， 又 能 达到 加 快 模型 预测 速度 目 


自 适应 算法 计算 出 的 入 可 能 会 不 足以 满足 真实 目标 个 数值 , 并 
日 在 目标 数量 很 小 时 ， 模 型 对 N 值 是 敏感 的 ， 为 防止 计算 出 的 


N= pss xWxH (9) 


既 能 满足 几乎 不 降低 模型 性 
的 。 另外 ， 当 块 密度 很 小 时 ， 


N ， 在 目标 数量 很 少 的 情况 下 出 现 偏差 ， 遂 将 N 最 小 值 设 定 
为 M 。 因 此 ， 候 选区 域 自 适 应 算法 最 终 产生 候选 框 个 数 为 
N=max{M, paw XW x H} (10) 


表 1 两 种 模型 在 准确 率 和 时 间 上 的 对 比 


(测试 平台 :CPU Premium G4560. 


8GB DDR4, Windows 10) 


数据 方法 N mAP(%) ”时 间 (s) 
SSD 19.4 2.140 
YOLO-v3 21.7 1.451 

STARE 
Faster R-CNN 300 74.8 17.937 
候选 区 域 自 适 应 156 74.8 9.502 
SSD 30.6 2.203 
YOLO-v3 47.2 1.238 

卫星 道路 
Faster R-CNN 300 93.6 17.253 
候选 区 域 自 适应 50 93.4 5.598 


3 ”实验 结果 与 分 析 


3.1 实验 数据 


网 状 结构 体检 测 模型 ， 检 测 出 的 结果 是 许多 块 状 集合 ， 每 
一 个 块 状 体 ， 包 含 了 自身 在 图 像 中 位 置信 息 以 及 所 属 类 别 。 文 


中 的 方法 在 于 ， 利 用 块 状 结构 反映 出 网 状 结构 的 分 布 ， 因 此 ， 


对 块 状 体 的 分 类 正确 ， 定 位 准确 是 最 期 望 的 结果 。 为 了 测试 模 
型 对 网 状 结构 体 的 检测 性 能 ,利用 2 组 不 同 的 数据 集 进 行 测试 ， 
计算 每 组 数据 中 的 准确 率 。 第 一 组 数据 为 STAREP2 眼 底 图 片 


库 ， 训 练 样本 为 分 辨 率 3304x2366 


7 


的 图 片 ， 在 实验 过 程 中 由 于 


分 辨 率 太 大 ， 所 以 将 一 张 图 片 九 等 分 成 分 辨 率 为 1168x779 的 九 


张 图 片 ， 最 终 训 练 样本 为 90 张 图 


片 ， 测 试 样本 为 36 张 图 片 ; 


第 二 组 数据 为 卫星 道路 ， 训 练 样本 为 分 辨 率 1862x900 的 12 张 


图 片 ， 测 试 样本 为 12 张 图 片 。 
3.2 平均 精度 均值 


在 目标 检测 领域 ， 检 测 结果 的 衡量 通常 采用 平均 精度 均值 


(mean average precision，mAP) 作 为 检测 结果 的 准确 性 评判 标 


与 召回 率 (RecalD) 绘 制 一 条 曲线 。 


准 。 对 于 检测 目标 中 的 每 一 个 类 别 C， 可 其 精确 率 (Precision) 


曲线 包围 面积 表示 平均 精度 


(AP)， 求 得 多 个 类 别 的 平均 精度 的 平均 值 ， 得 至 


mAP。mAP 值 越 大 ， 表 示 模 型 检 闹 


又 
平均 精度 均值 
上 结果 越 准确 ， 即 图 像 中 网 状 


二 


结构 目标 检测 越 完整 。 候 选区 域 自 


适应 检测 方法 检测 结果 如 图 
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3-2 所 示 。 


本 情况 | 
图 


标点 。 如 图 


坐标 ， 


甬 过 


通过 < 


十 模型 检测 
到 74.8%(STARE) 与 93.4%( 卫 星 道 
状 结构 的 基本 构成 分 布 特征 ， 为 后 期 视网膜 血管 分 


网 的 检测 提供 有 力 支 撑 。 
3.3 样本 扩 增 


像 中 网 状 结构 ， 履 盖 率 分 别 达 
首 路 )， 很 好 的 反映 了 图 像 中 网 
割 以 及 道路 


出 的 加 


利用 


基于 二 值 标 签 图 


方法 产生 大 量 训 练 样本 ， 为 少 样 


站 


标注 


标注 方法 中 ， 


候选 框 短 边 长 的 二 


6 所 示 ，A,B,C 分 别 代表 三 个 不 同 候选 
黑色 虚线 表示 中 心 坐标 之 间 的 距离 ， 设 三 个 候选 框 的 短 


框 


边 长 分 别 为 ,ls,lc ， 晶 


主 


十 


的 范 
重 有 从 


汉 


匡 A 
匡 


生成 章 


下 网 状 结构 体 的 检测 提供 了 解决 方案 。 
候选 框 中 心 坐标 时 ， 通 过 


中 心 坐标 之 间 的 距离 为 4= 上 4 ， 当 工 - 
m m 2 


浊 距 离 ， 在 中 心 线 4 


日 基于 二 值 标签 


y 
在 基于 二 值 标签 


区 


式 (2)， 以 当前 


办 


E 标 中 寻找 满足 要 求 的 4 


匡 的 中 心 点 


图 标注 方法 可 知 ，A, B 两 


和 周 ，B 点 始终 在 候选 


内 ， 使 得 分 级 算法 标注 过 程 中 不 会 出 现 因 两 个 候选 


区 域 太 小 导致 部 分 目标 


未 标注 的 情况 , 如 图 3-1(b) 所 示 ; 


同时 不 会 出 现 因 候 选 框 重印 


况 ， 如 图 3-1(c) 所 示 。 


区 域 太 大 导致 目标 重复 标注 的 情 
过 样本 扩 增 ， 分 别 获得 两 组 数据 最 终 


二 


通 


标注 候选 区 域 约 为 14000、600。 
仿 
@ (b) 人 

图 6 所 当选 取 二 ~: 时 ,新 候选 框 中 心 坐标 始终 在 当前 候选 框 范围 内 。 


人 ) 当 过 > ,新 候选 框 中 心 


坐标 距离 当前 候选 框 中 心 坐标 过 大 ,造成 候选 


框 标注 不 连续 ,部 分 网 状 结构 体 漏 标 注 , (0) 当 三 < 时 ,新 候选 框 中 心 坐 标 
距离 当前 候选 框 中 心 坐标 过 小 ,造成 候选 框 重复 标注 


3.4 自 适 应 选取 候选 区 域 


通过 两 组 数据 测试 


区 


适应 算法 ， 分 别 计算 比较 
一 组 数据 下 的 


区 域 候 选 自 


域 候选 
了 预测; 


自 适应 检测 模型 与 常规 目标 检测 模型 在 同 
侍 确 率 (mAP) 以 及 时 间 消 耗 。 结 果 如 表 1 所 示 。 


原始 


图 


预测 结果 


基于 候选 区 域 


自 


适应 检测 方法 对 STARE 数据 集 以 及 卫星 道路 数 


图 


据 集 的 检测 结果 


年 秀 ， 


从 表 
网 络 的 输 
候选 区 域 
于 


区 


-上 


碟 候 选 的 模型 


确 度 的 前 提 下 ， 大 大 提高 了 模型 


于 候选 区 域 自 适 应 方法 属于 基于 区 域 候选 的 模型 ， 在 模型 


第 


等 : 面向 少 样本 


ChinaX 


网 状 结 


恬 选 区 


1 可 知 ， 通 过 


域 自 适 应 方法 大 幅 减 少 


口 


检测 模型 YOLO-v3、SSD 


出 后 ， 与 基于 回归 的 


自 适应 检测 


方法 的 检测 


结果 准确 率 提 


4 Faster R-CNN 相 比 , 在 没有 损失 模型 


4 检测 速度 ， 时 间 减 少 约 


又 域 


高 约 43%; 
4 检测 准 


合作 期 刊 


VE 适应 检测 方法 


区 域 候选 


相 比 ， 
与 基 


I os 
4 中 


加 入 J 
的 模型 ， 


YOLO、 


为 继续 探究 
STARE 和 
区 域 N 与 模型 性 能 以 及 预测 时 间 的 关系 ， 


候选 


全 连接 层 进行 分 类 和 
未 加 入 全 连接 层 进行 分 类 
预测 速度 上 接近 YOLO 和 SSD, 同时 模型 预测 准确 度 远 远 高 了 


口 


于 回归 


Ee 


归 ， 而 YOLO、SSD 等 


SSD 等 一 系列 方法 。 


归 。 但 本 文 提 


| 


区 域 候选 


适应 方法 对 模型 


卫星 道路 数据 为 有 


9 所 示 。 


区 


8 表示 不 同 候选 区 域 数量 


下 模型 


到 


天 


区 域 


表示 候选 
ee 
， 模 型 
型 预测 时 间 
其 中 两 个 绿色 菱形 点 表示 在 由 区 域 
下 ， 模 型 
图 8 可 知 ， 候 选区 域 个 数 从 少 到 多 的 过 程 中 ， 模 型 


又 域 数 量 ， 纵 轴 表 示 检 闹 
区 域 候选 


出 的 方法 在 


4 性 能 的 影响 ， 
究 对 象 , 分 别 以 N 从 1~400， 计 算 
结果 如 


自 适 应 方法 产生 的 候选 


H 


以 


区 


8、 


4 性 能 表现 曲线 ， 横 
| 精度 度量 标准 mAP， 其 中 


区 域 


4 的 预测 性 能 (mAP); 


图 9 表示 不 同 候选 


1 线 图 , 横 轴 


表示 候选 


的 预测 时 间 。 


逐渐 收 


测 时 间 
模型 预 
法 计算 
性 能 


域 数量 大 于 1 
再 提高 ， 反 而 降 


值 时 ， 


4 


本 文通 过 


式 ， 
的 


度 的 效果 ; 同时 根据 网 状 结构 体 的 分 布 特征 与 结构 和 


敛 到 最 大 
达到 159 和 50 时 ， 
域 个 数 大 体 上 呈 线 性 关系 ,候选 区 域 个 数 增加 ， 


值 ， 在 STARE 和 了 


恬 选 自 适 / 


D 星 道路 数据 中 ， 
由 图 9 可 知 ， 


三 天 


和 提 


模型 的 怕 


义 


与 候选 


L 全 已 
上 用人 小 寺 近 辣 ; 


区 域 数 量 下 模 
匡 数 量 , 纵 轴 表示 检测 时 间 ， 
应 方法 产生 


的 候选 


会 已 


性 能 


当 N 分 别 


| 


模型 预 


结合 区 


测 时 间 变 长 。 
出 区 域 候选 网 络 输出 
分 发 挥 的 1 
重 界 


值 时 ， 若 继 


模型 性 能 大 幅 下 降 。 


氏 了 模型 检测 速度 ，: 


知 ,通过 候选 区 域 


8、9 可 


适应 广 
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